「AWSで構築するパターン別RAG構成解説」という内容で登壇しました #cm_odyssey

「AWSで構築するパターン別RAG構成解説」という内容で登壇しました #cm_odyssey

Clock Icon2024.07.08

こんにちは、つくぼし(tsukuboshi0755)です!

2024/7/8に開催された7/8 (月) Classmethod Odyssey ONLINE 生成AI編 - connpassにて、「AWSで構築するパターン別RAG構成解説」というタイトルでLT登壇しました。

概要

AWSで利用可能なRetrieverの種類と、それらを用いて構築可能なRAG(Retrieval-Augmented Generation)のインフラ構成パターンについて紹介し、それぞれの特徴と適用シナリオについて解説します。

スライド

動画

https://www.youtube.com/watch?v=QPhGs0iwBR8

参考サイト

補足

OpenSearch Serverlessの料金

OpenSearch Serverlessのアクティブレプリカを無効化した場合のOCUですが、以下の通り最小で0.5まで減らす事が可能という内容を頂きました。

https://aws.amazon.com/jp/blogs/news/vector-engine-for-amazon-opensearch-serverless-is-now-generally-available/

ベクトルエンジンは、最初は小さい 0.5 OCU を導入しながら、同じ機能を低スケールで提供し、ワークロードの需要に合わせてフル OCU 以上までスケールアップします

こちら認識できていなかったので、ご指摘ありがとうございます!

冗長性を落とす事が可能であれば、さらに料金を削減できそうですね。

2024/7時点でのOpenSearch Serverlessに関する料金については、以下のブログが詳しいので合わせてご覧ください。

https://dev.classmethod.jp/articles/amazon-opensearch-serverless-price-down/

Knowledge Bases form Amazon Bedrockの対象データソース追加

Knowledge Bases form Amazon Bedrockの対象データソースについて、登壇当時はS3のみの対応だったのですが、その後のアップデートにより以下の通り一部のSaaSやWeb Crawlerにも追加で対応されました!

https://dev.classmethod.jp/articles/knowledge-bases-for-amazon-bedrock-additional-data-sources-preview/

なお現状はベクトルデータベースにOpenSearch Serverlessを指定しないとS3以外のデータソースを使用できないようですので、ご注意ください。

最後に

今回は「AWSで構築するパターン別RAG構成解説」というタイトルでLT登壇しました。

AWSで構築できるRAG構成は様々なパターンがあり、それぞれの特徴を理解しておくことで、より効率的な生成AIアプリケーションの構築が可能になります。

AWS基盤上でRAG構成を作成したいと考えている方は、ぜひ一度見て頂けますと幸いです。

以上、つくぼし(tsukuboshi0755)でした!

この記事をシェアする

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.